F10: Stickprov och populationer, observationsstudier och experiment
När vi utgår ifrån ett begränsat datamaterial, och extrapolerar till en mer generell population, utövar vi statistisk inferens
Inferens blir ett viktigt inslag i del 2 av den här kursen, och vi ska börja lägga grunden för det redan idag
Deskriptiv statistik: Beskriva våra data på ett meningsfullt sätt
Inferens: Använda våra data för att dra slutsatser om världen utanför
Vi går ut och frågar folk på stan om de tycker att regeringen gör ett bra jobb
Med hjälp av svaren vi får kan vi lätt beräkna hur stor andel i
Vi kan lätt räkna ut hur stor andel i våra data som tycker si eller så,
\[\text{Andel positiva} = \cfrac{\text{Antal positiva respondenter}}{\text{Totalt antal respondenter}}\]
Den som samlar in data är ofta omedveten om att stickprovet har ett bias
Exempel på bias De Veaux et al (2021), sid 352
Vi har 5 observationer i en liten population: \(\{x_1, x_2, x_3, x_4, x_5\}\), och vi vill dra ett stickprov som inkluderar 2 av dessa observationer
Följande stickprov är möjliga, och ska ha samma sannolikhet att bli valda
\[\begin{align*} & \{x_1, x_2\}, \{x_1, x_3\}, \{x_1, x_4\}, \{x_1, x_5\}, \\ & \{x_2, x_3\}, \{x_2, x_4\}, \{x_2, x_5\}, \\ & \{x_3, x_4\}, \{x_3, x_5\} , \{x_4, x_5\} \end{align*}\]
Exempel på statistikor
Andelen i våra data som tycker att regeringen gör ett bra jobb är en statistika
Denna statistika kan användas som en skattning av hur stor del av befolkningen som tycker att regeringen gör ett bra jobb
Dessa slides skapades av Karl Sigfrid för kursen Statistik och Dataanalys I och har uppdaterats av Oskar Gustafsson och Valentin Zulj